Andrew Barto e Richard Sutton receberam o Prêmio Turing de 2025 por suas inovações em aprendizado por reforço, uma técnica fundamental que permite que máquinas aprendam com base em prazer e dor. Esta abordagem, baseada na teoria de que neurônios buscam maximizar o prazer, foi explorada por Barto desde 1977 e posteriormente aprimorada por Sutton. Com o avanço da inteligência artificial, suas contribuições se tornaram cruciais para sistemas como AlphaGo e ChatGPT. O Prêmio Turing é reconhecido como o 'Nobel da computação', e os vencedores dividirão um prêmio de um milhão de dólares.